Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m16b.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador6qtX3pFwXQZGivnJSY/L3zRv
Repositóriosid.inpe.br/MTC-m13@80/2006/05.04.18.27
Última Atualização2019:02.18.13.51.24 (UTC) simone
Repositório de Metadadossid.inpe.br/MTC-m13@80/2006/05.04.18.27.06
Última Atualização dos Metadados2019:04.12.20.42.20 (UTC) simone
Chave SecundáriaINPE-14434-TDI/1133
Chave de CitaçãoHoffmann:2006:ApReAd
TítuloAprendizagem por reforço na adaptação a obstáculos em navegação robótica autônoma não-estruturada baseada em imagens
Título AlternativoReinforcement learning for obstable avoidance in image based robotic autonomous non-structured navigation
CursoCAP-SPG-INPE-MCT-BR
Ano2006
Data Secundária20061215
Data2006-02-23
Data de Acesso17 maio 2024
Tipo da TeseDissertação (Mestrado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas212
Número de Arquivos651
Tamanho44848 KiB
2. Contextualização
AutorHoffmann, Leandro Toss
GrupoCAP-SPG-INPE-MCT-BR
BancaGuimarães, Lamartine Nogueira Frutuoso (presidente)
Silva, José Demisio Simões da (orientador)
Santos, Rafael Duarte Coelho dos
Osório, Fernando Santos
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2006-05-04 18:27:06 :: jefferson -> administrator ::
2006-09-27 21:19:44 :: administrator -> jefferson ::
2007-07-18 19:41:12 :: jefferson -> administrator ::
2009-07-07 20:07:33 :: administrator -> jefferson ::
2009-11-05 14:57:25 :: jefferson -> alessandra@sid.inpe.br ::
2010-01-11 19:24:22 :: alessandra@sid.inpe.br -> viveca@sid.inpe.br ::
2012-07-16 16:12:26 :: viveca@sid.inpe.br -> administrator ::
2018-06-05 03:43:16 :: administrator -> viveca@sid.inpe.br :: 2006
2019-01-30 17:55:24 :: viveca@sid.inpe.br -> sergio :: 2006
2019-04-12 20:38:44 :: sergio -> simone :: 2006
2019-04-12 20:42:20 :: simone -> :: 2006
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chaveinteligência artificial
aprendizagem de máquina
visão computacional
navegação autônoma
robótica
redes neurais
articial inteligence
machine learning
computer vision
autonomous navigation
robotics
neural nets
ResumoNas últimas décadas, a robótica tem desempenhado um papel importante na sociedade, com participação de destaque na indústria de manufatura de bens. Mais recentemente, aplicações de robôs móveis, desde simples brinquedos até a exploração de outros planetas, tem demonstrado o quão promissor o uso dessas ferramentas será num futuro próximo. Contudo, atualmente o custo e a complexidade de construção de robôs móveis, que sejam suficientemente flexíveis e ao mesmo tempo úteis, tem sido uma barreira para sua ampla disseminação. Neste sentido, técnicas de Inteligência Artificial vem sendo frequentemente estudadas, a fim de dotar os sistemas robóticos com capacidades de aprendizado, adaptação e autonomia. Este trabalho apresenta um estudo de aprendizagem de máquina, aplicado a navegação autônoma em robótica móvel. O objetivo principal é avaliar o desempenho de técnicas de aprendizagem por reforço, no uso de robôs móveis de baixo custo e baixa precisão, equipados com sensores de visão computacional. Para tanto, um robô foi modelado à luz de uma arquitetura de agente de aprendizagem, para através de imagens obtidas por uma câmera Charge-Coupled Device (CCD), ser capaz de aprender a navegar de forma autônoma, em ambientes internos não-estruturados. Os operadores de visão computacional são construídos com Redes Neurais Artificiais e algoritmos de rotulação de imagem, que identificam objetos diferenciados por suas características radiométricas. As posições relativas dos objetos na imagem são utilizadas para definir o estado do agente, que através da experimentação de ações, aprende a otimizar o seu processo de tomada de decisão. A implementação da arquitetura do agente de aprendizagem é suportada pelo protótipo de sistema Cool Autonomous Navigation Enterprise with Learning Agents (Canela), que viabilizou principalmente a conexão de sensores CCDs e a condução dos experimentos. Duas modelagens com aprendizado por reforço foram desenvolvidas, utilizando o algoritmo Q-learning, sendo o intuito da primeira prover uma navegação simples, evitando-se obstáculos e da segunda a exploração homogênea do ambiente. Uma série de ensaios foram realizados em um ambiente real, para validar a primeira modelagem. Os resultados obtidos demonstraram a capacidade de aprendizagem do agente, que navegou por um ambiente inicialmente desconhecido. Com a segunda modelagem, validada em experimentos de simulação, foi possível avaliar o bom desempenho de um sistema de navegação mais complexo, orientado a multi-objetivos. Os resultados encorajam o uso da modelagem de sistemas de navegação de robôs móveis, baseados em técnicas de aprendizado por reforço, proporcionando uma alternativa interessante aos métodos de programação tradicionais. ABSTRACT: In the last decades, robotic has become an important role for society, specially in the manufacturing industry. In recent times, applications of mobile robots, from simple toys to planets explorations, has shown how promising will be the use of these tools in a close future. Though, the cost and complexity in developing mobile robots nowadays, which should be suciently flexible and still helpful, has been a diculty for its broad deployment. Hence, Artificial Intelligence techniques has been studied frequently, aiming for introducing a learnable, flexible, and autonomous behavior to robotic systems. This work presents a machine learning study, applied to autonomous navigation in mobile robotic. The main goal is to analyze reinforcement learning techniques performance, when using low cost and low accuracy mobile robots, with on-board computer vision sensors. Thus, a robot was modeled as a learning agent architecture, which is able to learn to navigate autonomously in indoor non-structured environments, using images taken by a Charge-Coupled Device (CCD) camera. Computer vision operators are made with Artificial Neural Networks and image labeling algorithms, to recognize objects by its spectral features. Relative positions from images objects are used to define the agent state, which experiments actions, and learn to optimize its decision making process. The learning agent architecture implementation is supported by a prototype system, called Cool Autonomous Navigation Enterprise with Learning Agents (Canela), which holds the CCDs sensors connections and manages the experiments. Using the Q-learning algorithm, two reinforcement learning based models were developed. The first model aims to build a simple obstacle avoidance navigation system, and the second an environments homogeneous exploration navigation system. To evaluate the first model, a series of experiments were conducted in a real environment. The results has shown agents learning capabilities on obstacle avoidance and navigation in an unknown environment. The second model was evaluated by simulation experiments whose brought good results on applying a more complex and multi-goal oriented navigation system. The results encourage to use reinforcement learning based models in mobile robots navigation systems, bringing an interesting choice to traditional programming methods.
ÁreaCOMP
Arranjourlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Aprendizagem por reforço...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
publicacao.pdf 18/02/2019 10:52 16.4 MiB
Conteúdo da Pasta agreement
TERMO DE DEPOSITO ASSINADO LEANDRO TOSS HOFFMANN MESTRADO.pdf 18/02/2019 10:51 371.1 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://mtc-m16b.sid.inpe.br/ibi/6qtX3pFwXQZGivnJSY/L3zRv
URL dos dados zipadoshttp://mtc-m16b.sid.inpe.br/zip/6qtX3pFwXQZGivnJSY/L3zRv
Idiomapt
Grupo de Usuáriosadministrator
jefferson
sergio
simone
viveca@sid.inpe.br
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Detentor dos Direitosoriginalauthor yes
Detentor da CópiaSID/SCD
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Unidades Imediatamente Superiores8JMKD3MGPCW/3F2PHGS
DivulgaçãoNTRSNASA; BNDEPOSITOLEGAL.
Acervo Hospedeirocptec.inpe.br/walmeida/2003/04.25.17.12
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype creatorhistory descriptionlevel doi e-mailaddress electronicmailaddress format isbn issn label lineage mark mirrorrepository nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarymark session shorttitle sponsor subject targetfile tertiarymark tertiarytype url versiontype


Fechar